Surya-bench-solarwind
收藏魔搭社区2025-12-05 更新2025-09-20 收录
下载链接:
https://modelscope.cn/datasets/nasa-ibm-ai4science/Surya-bench-solarwind
下载链接
链接失效反馈官方服务:
资源简介:
# Solar Wind Forecasting Dataset
## Dataset Summary
This dataset provides hourly solar wind plasma and interplanetary magnetic field (IMF) parameters at L1, derived from NASA’s OMNI dataset. The primary forecasting target is the solar wind speed (`V`), while additional parameters are included for completeness:
- Solar wind speed (`V`)
- IMF Bx (GSE)
- IMF By (GSM)
- IMF Bz (GSM)
- Proton number density (`N`)
The dataset is structured for machine learning experiments, particularly in this collection for evaluating foundation model efficiency for space weather forecasting tasks. Temporal coverage spans from **May 13, 2010 to December 31, 2024**, with splits designed for consistent training, validation, and testing across years.
## Supported Tasks and Applications
- `time-series forecasting`: Predicting future solar wind speed from past observations.
- `regression`: Using solar wind parameters for supervised forecasting tasks.
## Dataset Structure
### Data Files
- `train.csv`: Instances from Feb 15 to Dec 31 in each year between 2010–2019
- `validation.csv`: Instances from Jan 15–31 of each year between 2010–2019
- `test.csv`: All instances from each year between 2020–2024
- `leaky_validation.csv`: Instances from Jan 1–14 and Feb 1-14 of each year between 2010–2019
### Features
Each row contains hourly measurements with the following fields:
- `V`: Solar wind speed (km/s) [primary target]
- `Bx_gse`, `By_gsm`, `Bz_gsm`: IMF components (nT)
- `N`: Proton number density (cm⁻³)
## Dataset Details
| Field | Description |
|-------------------------|--------------------------------------|
| **Temporal Coverage** | May 13, 2010 – Dec 31, 2024 |
| **File Format** | CSV (.csv) |
| **Data Shape** | (1, 5) per timestep |
| **Number of Time Steps**| 119,225 |
| **Cadence** | 1 hour |
| **Forecast Target** | Solar wind speed (`V`) |
## Authors
- Vishal Upendran, [vupendran@seti.org](mailto:vupendran@seti.org)

# 太阳风预测数据集(Solar Wind Forecasting Dataset)
## 数据集概述
本数据集源自美国国家航空航天局(National Aeronautics and Space Administration,NASA)的OMNI数据集(OMNI Dataset),提供L1点处的逐小时太阳风等离子体与行星际磁场(Interplanetary Magnetic Field,IMF)参数。核心预测目标为太阳风速度(`V`),额外纳入其余参数以保证数据集完整性:
- 太阳风速度(`V`)
- IMF Bx分量(地心太阳黄道坐标系,Geocentric Solar Ecliptic,GSE)
- IMF By分量(地心太阳磁层坐标系,Geocentric Solar Magnetospheric,GSM)
- IMF Bz分量(地心太阳磁层坐标系,Geocentric Solar Magnetospheric,GSM)
- 质子数密度(`N`)
本数据集专为机器学习实验设计,尤其适用于评估大语言模型(Large Language Model,LLM)在空间天气预报任务中的效率。数据集的时间覆盖范围为**2010年5月13日至2024年12月31日**,并按年份划分了统一的训练集、验证集与测试集。
## 支持的任务与应用场景
- 时间序列预测(Time-series Forecasting):基于过往观测数据预测未来太阳风速度
- 回归分析(Regression):利用太阳风参数开展有监督预测任务
## 数据集结构
### 数据文件
- `train.csv`:包含2010至2019年每年2月15日至12月31日的样本
- `validation.csv`:包含2010至2019年每年1月15日至31日的样本
- `test.csv`:包含2020至2024年每年的全部样本
- `leaky_validation.csv`:包含2010至2019年每年1月1日至14日与2月1日至14日的样本
### 字段说明
每条记录对应一小时的观测数据,包含以下字段:
- `V`:太阳风速度,单位为千米每秒(km/s)[核心预测目标]
- `Bx_gse`、`By_gsm`、`Bz_gsm`:行星际磁场分量,单位为纳特(nT)
- `N`:质子数密度,单位为每立方厘米(cm⁻³)
## 数据集详细信息
| 字段名称 | 描述内容 |
|-------------------------|---------------------------------------|
| **时间覆盖范围** | 2010年5月13日 — 2024年12月31日 |
| **文件格式** | 逗号分隔值文件(CSV,.csv) |
| **数据形状** | 每个时间步对应(1, 5)维度的数据 |
| **总时间步数量** | 119,225 |
| **采样频率** | 每小时1次 |
| **预测目标** | 太阳风速度(`V`) |
## 作者信息
- 维沙尔·乌彭德兰(Vishal Upendran),[vupendran@seti.org](mailto:vupendran@seti.org)

提供机构:
maas
创建时间:
2025-08-21
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集基于NASA OMNI数据,提供2010年5月至2024年12月的每小时太阳风参数,包括速度、IMF分量和质子数密度,主要用于机器学习中的时间序列预测和回归任务,以支持空间天气预报。
以上内容由遇见数据集搜集并总结生成



